Cover_19-6_gruen_low

Schweizer Fachzeitschrift
für Publishing und Digitaldruck


Heft-Archiv >> 2007 >> Publisher 2-07 >> Prepress >> Adobe �Mars�: So offen war PDF noch nie

Adobe �Mars�: So offen war PDF noch nie

So offen war PDF noch nie

Unter dem Stichwort «Mars» entwickelt Adobe eine XML-Variante des PDF-Formats. Was auf den ersten Blick unspektakulär erscheint, entpuppt sich bei näherem Hinsehen als enorme Erleichterung für den Datenaustausch und automatische Arbeitsabläufe.

MATTHIAS SCHÜSSLER Seit einiger Zeit arbeitet Adobe an einer Technologie namens «Mars» (siehe Publisher 6-06, Seite 5). Sie ist für das Speichern und Laden von PDF-Dokumenten zuständig und scheint somit etwas vom Überflüssigsten zu sein, was man sich vorstellen kann. Das Sichern auf der Festplatte beherrschen Acrobat und der Reader von jeher bestens. Es will somit nicht recht einleuchten, weswegen man eine PDF-Datei nun auch als «Mars»-Variante speichern kann. Öffnet man die «Mars»-Datei, stellt man fest, dass sie dem Original gleicht wie ein Ei dem anderen.

Das Entscheidende bei «Mars» ist indes nicht das Was, sondern das Wie: also die Art und Weise, wie Mars PDF-Dokumente speichert. Die ist nicht nur neu, sondern sie läutet auch eine Revolution ein. Mars wird den Dokumentenaustausch erleichtern und automatische Arbeitsflüsse extrem vereinfachen.

Alte Eierschale, neuer Dotter

Das neue Plug-in, das wir als Beta-Version getestet haben, sichert das Dokument als XML-Datenstrom. Hängt man an eine Mars-Datei die Endung «.zip» an, kann man sie mit dem bekannten Komprimierungsprogramm öffnen und erkennt die wahre Natur der «Mars»-Datei: Sie enthält eine Ordnerstruktur, in der die Ressourcen der PDF-Datei einzeln greifbar sind. Im Ordner color finden sich die eingebetteten Farbprofile. Unter fonts liegen analog die in der PDF-Datei eingebetteten Schriften – allerdings nur als Subsets, d.h. nicht als vollwertige Font-Dateien. Im Verzeichnis meta-inf stecken Meta-Informationen. Das sind die beschreibenden Angaben wie Autor, Titel und andere Attribute, die man in der Bridge, im Windows-Explorer oder via Finder auswerten kann. Im Ordner page sind die einzelnen Seiten gespeichert. Sie liegen als SVG vor. SVG ist Adobes Scalable-Vector-Graphics-Format, ein offener Standard für zweidimensionale vektororientierte Layouts. Im Ordner mit den einzelnen Seiten stecken auch die eingebetteten Bilder, also beispielsweise die JPG-Grafiken, die auf der Seite positioniert wurden.

Mit anderen Worten: Mit der alten Methode, Dokumente zu speichern, erhält man eine binäre Datei. Das ist ein erratischer Block, in dem alle Ressourcen – Bilder, Schriften, Meta-Informationen, Text, Seitenstruktur – untrennbar verschmolzen sind. Die neue Methode sichert das Dokument als locker geschnürtes Paket, das man bei Bedarf jederzeit auspacken kann. Die einzelnen Ressourcen sind für die automatische oder manuelle Bearbeitung greifbar. Die Seiten selbst liegen als XML vor – also in Form einer strukturierten Sprache, die als offener und rundum akzeptierter Standard von allen wichtigen Softwareanbietern unterstützt wird. Die Extensible Markup Language kann mit Standardmitteln von den wichtigen Programmen oder Datensystemen verarbeitet werden. Auch bei Microsoft, Windows und Office 2007 spielt sie eine wichtige Rolle, wie die ausführliche Berichterstattung des Publisher zum Thema XPS zeigt (siehe Publisher 1-07, Seite 50, und Publisher 6-06, Seite 56).

Erratische Blöcke aufbrechen

Indem eine PDF-Datei mit «Mars» auch in XML repräsentiert werden kann, werden die Hürden für die automatische Verarbeitung von PDF-Dateien markant niedriger. Wenn ein Dritthersteller in seinem Produkt PDF-Unterstützung anbieten wollte – beispielsweise zur Ausgabe, zur Weiterverarbeitung oder aber als Container für weiterzuverarbeitende Daten – ,musste er bislang die entsprechenden Importfilter für das (binäre) Acrobat-Format entwickeln. Das ist kein Ding der Unmöglichkeit. Adobe hat das Format offengelegt und vielen PDF-Programmen und Tools den Boden bereitet. Dennoch ist die korrekte Umsetzung des komplexen Formats alles andere als trivial.

Mit Mars wird das sehr viel einfacher. Wie erläutert, wird man auf die Ressourcen und Elemente mit Standard-mitteln zugreifen können. Das eröffnet eine Reihe von Möglichkeiten; Adobe nennt in der Beschreibung zum «Mars»-Projekt die folgenden:

  • Einfache Daten-Extraktion und Integration
  • Verbesserter Zugang zu den Meta-Daten für die «intelligente» Indizierung
  • Dokumentkreation aus Datenbanken oder Unternehmensanwendungen
  • Standardisierte Dokumentenzusammenführung und einfachere Dokumentenanalyse und überprüfung

Was das konkret heisst, bleibt abzuwarten. Vorstellen kann man sich so etwas Schönes wie einen Workflow, bei dem ganz ohne Beteiligung des Distillers aus einem Office-2007-Dokument (das ebenfalls in XML vorliegt) eine PDF-Datei wird. Eine so genannte Transformation, also eine Umstrukturierung der XML-Datei, müsste dazu ausreichend sein. Ob das in der Realität dann so sein wird, muss sich erst noch zeigen. So schnell wird der Distiller im PDF-Alltag dann wohl doch nicht überflüssig werden. Wenn eine PDF/X-Datei entstehen soll, braucht es auch weiterhin ein Werkzeug, das die PDF-Datei auf Herz und Nieren prüft.

Bevor «Mars» seine Wirkung entfaltet, muss die Technologie erst Serienreife erlangen und gleich robust funktionieren, wie das mit dem herkömmlichen Format der Fall ist. Auch ist XML nicht so trivial, wie es manchmal dargestellt wird. Eine wohlgeformte, das heisst in allen Belangen korrekte PDF-Datei schüttelt auch ein erfahrener XML-Anwender nicht aus dem Ärmel. Das zeigt sich, wenn man einen Blick in die Datei «pg.svg» wirft. Sie repräsentiert eine einzelne Seite im Dokument. Dennoch ist unzweifelhaft, dass «Mars» einen grossen Schritt in eine offenere Zukunft darstellt und die Art und Weise, wie wir mit Dokumenten umgehen, mittelfristig massiv vereinfachen wird.

Mars aus erster Hand

Am 8. Mai wird Jim King, der PDF-Architekt von Adobe, am XPS/PDF-Forum in Winterthur erstmals in Europa öffentlich über «Mars» sprechen. Details zu diesem Event finden Sie auf der vierten Umschlagseite dieses Heftes und im Web unter www.publisher.ch/events